Comparing Code Explanations Created by Students and Large Language Models - 专知论文

会员服务 ·

0

代码 · 大型语言模型 · 示例 · 语言模型 · 可理解性 ·

2023 年 4 月 8 日

Comparing Code Explanations Created by Students and Large Language Models

翻译：比较学生与大语言模型生成的代码解释

Juho Leinonen,Paul Denny,Stephen MacNeil,Sami Sarsa,Seth Bernstein,Joanne Kim,Andrew Tran,Arto Hellas

from arxiv, 8 pages, 3 figures. To be published in Proceedings of the 2023 Conference on Innovation and Technology in Computer Science Education V. 1

Reasoning about code and explaining its purpose are fundamental skills for computer scientists. There has been extensive research in the field of computing education on the relationship between a student's ability to explain code and other skills such as writing and tracing code. In particular, the ability to describe at a high-level of abstraction how code will behave over all possible inputs correlates strongly with code writing skills. However, developing the expertise to comprehend and explain code accurately and succinctly is a challenge for many students. Existing pedagogical approaches that scaffold the ability to explain code, such as producing exemplar code explanations on demand, do not currently scale well to large classrooms. The recent emergence of powerful large language models (LLMs) may offer a solution. In this paper, we explore the potential of LLMs in generating explanations that can serve as examples to scaffold students' ability to understand and explain code. To evaluate LLM-created explanations, we compare them with explanations created by students in a large course ($n \approx 1000$) with respect to accuracy, understandability and length. We find that LLM-created explanations, which can be produced automatically on demand, are rated as being significantly easier to understand and more accurate summaries of code than student-created explanations. We discuss the significance of this finding, and suggest how such models can be incorporated into introductory programming education.

翻译：理解代码并解释其目的是计算机科学家的基本技能。在计算机教育领域，已有大量研究探讨学生解释代码的能力与编写、追踪代码等其他技能之间的关系。具体而言，从高抽象层次描述代码在所有可能输入下的行为方式的能力与代码编写技能呈强相关。然而，对于许多学生而言，培养准确、简洁地理解和解释代码的专业能力仍是一大挑战。现有的教学法（如按需生成示例代码解释）虽然能支持解释代码的能力培养，但难以大规模应用于大型课堂。近年来强大语言模型（LLMs）的兴起可能为此提供解决方案。本文探索了LLMs在生成解释方面的潜力，这些解释可作为示例来帮助学生构建理解与解释代码的能力。为评估LLM生成的解释，我们将其与大型课程（$n \approx 1000$）中学生生成的解释进行了准确性、可理解性和长度方面的比较。研究发现，与学生的解释相比，可自动按需生成的LLM解释被评价为显著更易理解且能更准确地概括代码。我们讨论了这一发现的意义，并提出了如何将此类模型融入入门编程教育的建议。

0

相关内容

代码（Code）是专知网的一个重要知识资料文档板块，旨在整理收录论文源代码、复现代码，经典工程代码等，便于用户查阅下载使用。

【2023新书】使用Python进行统计和数据可视化，554页pdf

【2023新书】使用Python进行统计和数据可视化，554页pdf

专知会员服务

130+阅读 · 2023年1月29日

【2023新书】分布测试的主题和技术，163页pdf

【2023新书】分布测试的主题和技术，163页pdf

专知会员服务

17+阅读 · 2023年1月19日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

59+阅读 · 2022年12月10日

paper速读：美国海军陆战队《职业军事教育中的兵棋推演：挑战与解决方案》35页pdf

paper速读：美国海军陆战队《职业军事教育中的兵棋推演：挑战与解决方案》35页pdf

专知会员服务

83+阅读 · 2022年3月29日

【干货书】计算机科学家的数学，153页pdf

【干货书】计算机科学家的数学，153页pdf

专知会员服务

177+阅读 · 2021年7月27日

【2020新书】Python Pro专业实践原则，Practices of the Python Pro，250页pdf

【2020新书】Python Pro专业实践原则，Practices of the Python Pro，250页pdf

专知会员服务

153+阅读 · 2020年1月25日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

84+阅读 · 2019年10月9日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

106+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

「Github」多模态机器学习文章阅读列表

「Github」多模态机器学习文章阅读列表

专知

124+阅读 · 2019年8月15日

AI/ML/DNN硬件加速设计怎么入门？

AI/ML/DNN硬件加速设计怎么入门？

StarryHeavensAbove

11+阅读 · 2018年12月4日

【机器视觉】计算机视觉研究入门全指南

【机器视觉】计算机视觉研究入门全指南

产业智能官

11+阅读 · 2018年9月23日

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

专知

13+阅读 · 2018年6月24日

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

专知

10+阅读 · 2018年4月12日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

【推荐】用Python/OpenCV实现增强现实

【推荐】用Python/OpenCV实现增强现实

机器学习研究会

15+阅读 · 2017年11月16日

可解释的CNN

可解释的CNN

CreateAMind

18+阅读 · 2017年10月5日

自然语言处理 (NLP)资源大全

自然语言处理 (NLP)资源大全

机械鸡

35+阅读 · 2017年9月17日

McMullen地毯上自仿测度的加倍性及其相关分形问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

雌激素与小鼠植入前胚胎发育过程中表观遗传模式正确建立的相关性研究

国家自然科学基金

0+阅读 · 2015年12月31日

miR-125b调控红细胞脱核成熟的作用及其机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

Ghrelin对牛卵母细胞体外成熟的调控机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

骨折愈合过程中miR-142表达激活促进成骨细胞活性与新骨形成的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

循环let-7e介导的CD4+T细胞和内皮细胞间通讯在ox-LDL致内皮损伤中的作用

国家自然科学基金

0+阅读 · 2012年12月31日

ISL1在胚胎干细胞向心肌细胞分化过程中的表观遗传调控机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于MARVELD1调控的miRNA对组蛋白H4甲基化修饰/染色质重塑的影响及其与细胞增殖关系的研究

国家自然科学基金

0+阅读 · 2011年12月31日

miRNA-16在正常及病理性红细胞分化成熟过程中的表达及功能研究

国家自然科学基金

0+阅读 · 2011年12月31日

雌激素受体S309位点磷酸化在小鼠乳腺发育和癌变中的作用

国家自然科学基金

0+阅读 · 2009年12月31日

Explainable Activity Recognition for Smart Home Systems

Arxiv

0+阅读 · 2023年5月26日

Towards Leaving No Indic Language Behind: Building Monolingual Corpora, Benchmark and Models for Indic Languages

Arxiv

0+阅读 · 2023年5月24日

Have LLMs Advanced Enough? A Challenging Problem Solving Benchmark For Large Language Models

Arxiv

0+阅读 · 2023年5月24日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A Survey on XAI for Beyond 5G Security: Technical Aspects, Use Cases, Challenges and Research Directions

Arxiv

25+阅读 · 2022年4月27日

Machine Learning: Algorithms, Models, and Applications

Arxiv

23+阅读 · 2022年1月6日

An Attentive Survey of Attention Models

An Attentive Survey of Attention Models

Arxiv

44+阅读 · 2020年12月15日

Directions for Explainable Knowledge-Enabled Systems

Directions for Explainable Knowledge-Enabled Systems

Arxiv

26+阅读 · 2020年3月17日

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Arxiv

16+阅读 · 2020年3月12日

VIP会员

文章信息

相关主题

大型语言模型

最新内容

《越野作战环境下路径规划的多准则整数规划模型》

《越野作战环境下路径规划的多准则整数规划模型》

专知会员服务

4+阅读 · 今天8:06

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

专知会员服务

3+阅读 · 今天8:00

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

专知会员服务

3+阅读 · 今天7:53

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

专知会员服务

6+阅读 · 今天7:49

《同步多无人机系统中的故障与通信》

《同步多无人机系统中的故障与通信》

专知会员服务

2+阅读 · 今天6:23

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

2+阅读 · 7月28日

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

7+阅读 · 7月28日

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

7+阅读 · 7月28日

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

8+阅读 · 7月28日

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

8+阅读 · 7月28日

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

9+阅读 · 7月28日

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

5+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

10+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

14+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

9+阅读 · 7月27日

相关VIP内容

【2023新书】使用Python进行统计和数据可视化，554页pdf

【2023新书】使用Python进行统计和数据可视化，554页pdf

专知会员服务

130+阅读 · 2023年1月29日

【2023新书】分布测试的主题和技术，163页pdf

【2023新书】分布测试的主题和技术，163页pdf

专知会员服务

17+阅读 · 2023年1月19日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

59+阅读 · 2022年12月10日

paper速读：美国海军陆战队《职业军事教育中的兵棋推演：挑战与解决方案》35页pdf

paper速读：美国海军陆战队《职业军事教育中的兵棋推演：挑战与解决方案》35页pdf

专知会员服务

83+阅读 · 2022年3月29日

【干货书】计算机科学家的数学，153页pdf

【干货书】计算机科学家的数学，153页pdf

专知会员服务

177+阅读 · 2021年7月27日

【2020新书】Python Pro专业实践原则，Practices of the Python Pro，250页pdf

【2020新书】Python Pro专业实践原则，Practices of the Python Pro，250页pdf

专知会员服务

153+阅读 · 2020年1月25日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

84+阅读 · 2019年10月9日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

106+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

《越野作战环境下路径规划的多准则整数规划模型》

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

相关资讯

「Github」多模态机器学习文章阅读列表

「Github」多模态机器学习文章阅读列表

专知

124+阅读 · 2019年8月15日

AI/ML/DNN硬件加速设计怎么入门？

AI/ML/DNN硬件加速设计怎么入门？

StarryHeavensAbove

11+阅读 · 2018年12月4日

【机器视觉】计算机视觉研究入门全指南

【机器视觉】计算机视觉研究入门全指南

产业智能官

11+阅读 · 2018年9月23日

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

专知

13+阅读 · 2018年6月24日

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

专知

10+阅读 · 2018年4月12日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

【推荐】用Python/OpenCV实现增强现实

【推荐】用Python/OpenCV实现增强现实

机器学习研究会

15+阅读 · 2017年11月16日

可解释的CNN

可解释的CNN

CreateAMind

18+阅读 · 2017年10月5日

自然语言处理 (NLP)资源大全

自然语言处理 (NLP)资源大全

机械鸡

35+阅读 · 2017年9月17日

相关论文

Explainable Activity Recognition for Smart Home Systems

Arxiv

0+阅读 · 2023年5月26日

Towards Leaving No Indic Language Behind: Building Monolingual Corpora, Benchmark and Models for Indic Languages

Arxiv

0+阅读 · 2023年5月24日

Have LLMs Advanced Enough? A Challenging Problem Solving Benchmark For Large Language Models

Arxiv

0+阅读 · 2023年5月24日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A Survey on XAI for Beyond 5G Security: Technical Aspects, Use Cases, Challenges and Research Directions

Arxiv

25+阅读 · 2022年4月27日

Machine Learning: Algorithms, Models, and Applications

Arxiv

23+阅读 · 2022年1月6日

An Attentive Survey of Attention Models

An Attentive Survey of Attention Models

Arxiv

44+阅读 · 2020年12月15日

Directions for Explainable Knowledge-Enabled Systems

Directions for Explainable Knowledge-Enabled Systems

Arxiv

26+阅读 · 2020年3月17日

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Arxiv

16+阅读 · 2020年3月12日

相关基金

McMullen地毯上自仿测度的加倍性及其相关分形问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

雌激素与小鼠植入前胚胎发育过程中表观遗传模式正确建立的相关性研究

国家自然科学基金

0+阅读 · 2015年12月31日

miR-125b调控红细胞脱核成熟的作用及其机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

Ghrelin对牛卵母细胞体外成熟的调控机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

骨折愈合过程中miR-142表达激活促进成骨细胞活性与新骨形成的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

循环let-7e介导的CD4+T细胞和内皮细胞间通讯在ox-LDL致内皮损伤中的作用

国家自然科学基金

0+阅读 · 2012年12月31日

ISL1在胚胎干细胞向心肌细胞分化过程中的表观遗传调控机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于MARVELD1调控的miRNA对组蛋白H4甲基化修饰/染色质重塑的影响及其与细胞增殖关系的研究

国家自然科学基金

0+阅读 · 2011年12月31日

miRNA-16在正常及病理性红细胞分化成熟过程中的表达及功能研究

国家自然科学基金

0+阅读 · 2011年12月31日

雌激素受体S309位点磷酸化在小鼠乳腺发育和癌变中的作用

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员