并非人人皆因大语言模型受益：程序化数据科学中人工智能素养的行为模式与教学启示 (Not Everyone Wins with LLMs: Behavioral Patterns and Pedagogical Implications for AI Literacy in Programmatic Data Science) - 专知论文

会员服务 ·

0

分析 · 语言模型 · 行为模式 · 数据科学 · 数据分析 ·

Not Everyone Wins with LLMs: Behavioral Patterns and Pedagogical Implications for AI Literacy in Programmatic Data Science

翻译：并非人人皆因大语言模型受益：程序化数据科学中人工智能素养的行为模式与教学启示

Qianou Ma,Kenneth Koedinger,Tongshuang Wu

LLMs promise to democratize technical work in complex domains like programmatic data analysis, but not everyone benefits equally. We study how students with varied experiences use LLMs to complete Python-based data analysis in computational notebooks in a graduate course. Drawing on homework logs, recordings, and surveys from 36 students, we ask: Which experience matters most, and how does it shape AI use? Our mixed-methods analysis shows that technical experience -- not AI familiarity or communication skills -- remains a significant predictor of success. Students also vary widely in how they leverage LLMs, struggling at stages of forming intent, expressing inputs, interpreting outputs, and assessing results. We identify success and failure behaviors, such as providing context or decomposing prompts, that distinguish effective use. These findings inform AI literacy interventions, highlighting that lightweight demonstrations improve surface fluency but are insufficient; deeper training and scaffolds are needed to cultivate resilient AI use skills.

翻译：大语言模型有望在程序化数据分析等复杂领域实现技术工作的民主化，但并非所有人都能平等获益。本研究探讨了在研究生课程中，具有不同经验的学生如何利用大语言模型在计算笔记本中完成基于Python的数据分析。通过分析36名学生的作业日志、录音记录与问卷调查，我们提出核心问题：何种经验最为关键？它如何塑造人工智能的使用方式？我们的混合方法分析表明，技术经验——而非对人工智能的熟悉程度或沟通技巧——仍是预测成功的重要指标。学生在利用大语言模型的方式上也存在显著差异，他们在形成意图、表达输入、解读输出和评估结果等阶段均面临挑战。我们识别了区分有效使用的成功与失败行为模式，例如提供上下文或分解提示等。这些发现为人工智能素养培养提供了实践依据，表明轻量级演示虽能提升表面流畅度，但远远不足；需要更深入的训练与支架式教学，才能培养出稳健的人工智能应用能力。

0

相关内容

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

专知会员服务

42+阅读 · 2025年4月16日

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

专知会员服务

32+阅读 · 2025年2月10日

【新书】基于大型语言模型的解决方案：如何通过具有成本效益的生成式 AI 应用交付价值

【新书】基于大型语言模型的解决方案：如何通过具有成本效益的生成式 AI 应用交付价值

专知会员服务

54+阅读 · 2024年8月2日

掌握使用Python的大型语言模型

掌握使用Python的大型语言模型

专知会员服务

63+阅读 · 2024年5月22日

大语言模型视角下的智能规划方法综述

大语言模型视角下的智能规划方法综述

专知会员服务

136+阅读 · 2024年4月20日

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

专知会员服务

34+阅读 · 2024年1月26日

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

专知会员服务

84+阅读 · 2023年8月8日

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

专知会员服务

78+阅读 · 2023年2月15日

【VLDB2022教程】从BERT到GPT-3 Codex:利用大型语言模型的潜力进行数据管理

【VLDB2022教程】从BERT到GPT-3 Codex:利用大型语言模型的潜力进行数据管理

专知会员服务

20+阅读 · 2022年10月3日

【2020新书】Python大数据处理，Mastering Large Datasets with Python

【2020新书】Python大数据处理，Mastering Large Datasets with Python

专知会员服务

54+阅读 · 2020年2月2日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知

43+阅读 · 2020年4月4日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

超强干货|Python金融数据量化分析教程+机器学习电子书

超强干货|Python金融数据量化分析教程+机器学习电子书

Python程序员

16+阅读 · 2018年6月25日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

带你入门Python数据挖掘与机器学习（附代码、实例）

带你入门Python数据挖掘与机器学习（附代码、实例）

数据派THU

13+阅读 · 2018年4月6日

福利 | 当Python遇上大数据与机器学习，入门so easy！

福利 | 当Python遇上大数据与机器学习，入门so easy！

DBAplus社群

13+阅读 · 2018年3月11日

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

AI100

13+阅读 · 2017年11月28日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Human-AI Interaction: Evaluating LLM Reasoning on Digital Logic Circuit included Graph Problems, in terms of creativity in design and analysis

Arxiv

0+阅读 · 2月17日

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

Arxiv

0+阅读 · 2月16日

LLM Reasoning Predicts When Models Are Right: Evidence from Coding Classroom Discourse

Arxiv

0+阅读 · 2月10日

Data-Prompt Co-Evolution: Growing Test Sets to Refine LLM Behavior

Arxiv

0+阅读 · 2月8日

Relying on LLMs: Student Practices and Instructor Norms are Changing in Computer Science Education

Arxiv

0+阅读 · 2月5日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

Information Security Based on LLM Approaches: A Review

Arxiv

0+阅读 · 2月1日

A Survey of LLM Alignment: Instruction Understanding, Intention Reasoning, and Reliable Generation

Arxiv

0+阅读 · 1月29日

Unlearning in LLMs: Methods, Evaluation, and Open Challenges

Arxiv

0+阅读 · 1月19日

Changes in Coding Behavior and Performance Since the Introduction of LLMs

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

相关VIP内容

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

专知会员服务

42+阅读 · 2025年4月16日

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

专知会员服务

32+阅读 · 2025年2月10日

【新书】基于大型语言模型的解决方案：如何通过具有成本效益的生成式 AI 应用交付价值

【新书】基于大型语言模型的解决方案：如何通过具有成本效益的生成式 AI 应用交付价值

专知会员服务

54+阅读 · 2024年8月2日

掌握使用Python的大型语言模型

掌握使用Python的大型语言模型

专知会员服务

63+阅读 · 2024年5月22日

大语言模型视角下的智能规划方法综述

大语言模型视角下的智能规划方法综述

专知会员服务

136+阅读 · 2024年4月20日

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

专知会员服务

34+阅读 · 2024年1月26日

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

专知会员服务

84+阅读 · 2023年8月8日

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

专知会员服务

78+阅读 · 2023年2月15日

【VLDB2022教程】从BERT到GPT-3 Codex:利用大型语言模型的潜力进行数据管理

【VLDB2022教程】从BERT到GPT-3 Codex:利用大型语言模型的潜力进行数据管理

专知会员服务

20+阅读 · 2022年10月3日

【2020新书】Python大数据处理，Mastering Large Datasets with Python

【2020新书】Python大数据处理，Mastering Large Datasets with Python

专知会员服务

54+阅读 · 2020年2月2日

热门VIP内容

开通专知VIP会员享更多权益服务

美国防部门开始扩建金穹反导系统基础设施

《基于选择性深度神经网络分类的弹性无线通信》最新报告

《多域作战中融合网络、电子战与动能机动》

《在东欧磨砺反无人机技能》美陆军最新反无人机训练报告

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知

43+阅读 · 2020年4月4日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

超强干货|Python金融数据量化分析教程+机器学习电子书

超强干货|Python金融数据量化分析教程+机器学习电子书

Python程序员

16+阅读 · 2018年6月25日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

带你入门Python数据挖掘与机器学习（附代码、实例）

带你入门Python数据挖掘与机器学习（附代码、实例）

数据派THU

13+阅读 · 2018年4月6日

福利 | 当Python遇上大数据与机器学习，入门so easy！

福利 | 当Python遇上大数据与机器学习，入门so easy！

DBAplus社群

13+阅读 · 2018年3月11日

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

AI100

13+阅读 · 2017年11月28日

相关论文

Human-AI Interaction: Evaluating LLM Reasoning on Digital Logic Circuit included Graph Problems, in terms of creativity in design and analysis

Arxiv

0+阅读 · 2月17日

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

Arxiv

0+阅读 · 2月16日

LLM Reasoning Predicts When Models Are Right: Evidence from Coding Classroom Discourse

Arxiv

0+阅读 · 2月10日

Data-Prompt Co-Evolution: Growing Test Sets to Refine LLM Behavior

Arxiv

0+阅读 · 2月8日

Relying on LLMs: Student Practices and Instructor Norms are Changing in Computer Science Education

Arxiv

0+阅读 · 2月5日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

Information Security Based on LLM Approaches: A Review

Arxiv

0+阅读 · 2月1日

A Survey of LLM Alignment: Instruction Understanding, Intention Reasoning, and Reliable Generation

Arxiv

0+阅读 · 1月29日

Unlearning in LLMs: Methods, Evaluation, and Open Challenges

Arxiv

0+阅读 · 1月19日

Changes in Coding Behavior and Performance Since the Introduction of LLMs

Arxiv

0+阅读 · 1月16日

相关基金

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员