揭示ChatGPT在软件开发中的作用：基于GitHub上开发者与ChatGPT交互的洞察 (Unveiling the Role of ChatGPT in Software Development: Insights from Developer-ChatGPT Interactions on GitHub) - 专知论文

会员服务 ·

0

软件 · ChatGPT · 软件开发 · GitHub · 交互 ·

2025 年 12 月 31 日

Unveiling the Role of ChatGPT in Software Development: Insights from Developer-ChatGPT Interactions on GitHub

翻译：揭示ChatGPT在软件开发中的作用：基于GitHub上开发者与ChatGPT交互的洞察

Ruiyin Li,Peng Liang,Yifei Wang,Yangxiao Cai,Weisong Sun,Zengyang Li

from arxiv, 30 pages, 11 images, 3 tables, Manuscript revision submitted to a journal (2025)

The advent of Large Language Models (LLMs) has introduced a new paradigm in Software Engineering (SE), with generative AI tools like ChatGPT gaining widespread adoption among developers. While ChatGPT's potential has been extensively discussed, empirical evidence about how developers actually use LLMs' assistance in real-world practices remains limited. To bridge this gap, we conducted a large-scale empirical analysis of ChatGPT usage on GitHub, and we presented DevChat, a curated dataset of 2,547 publicly shared ChatGPT conversation links collected from GitHub between May 2023 and June 2024. Through comprehensively analyzing DevChat, we explored the characteristics of developer-ChatGPT interaction patterns and identified five key categories of developers' purposes for sharing developer-ChatGPT conversations during software development. Additionally, we investigated the dominant development-related activities in which ChatGPT is used, and presented a mapping framework that links GitHub data sources, development-related activities, and SE tasks. The findings show that interactions are typically short and task-focused (most are 1-3 turns); developers share conversations mainly to delegate tasks, resolve problems, and acquire knowledge, revealing five purpose categories; ChatGPT is most frequently engaged for Software Implementation and Maintenance & Evolution; we identified 39 fine-grained SE tasks supported by ChatGPT, with Code Generation & Completion as well as Code modification & Optimization being the most prominent. Our study offers a comprehensive mapping of ChatGPT's applications in real-world software development scenarios and provides a foundation for understanding LLMs' practical roles in software development.

翻译：大型语言模型（LLM）的出现为软件工程（SE）引入了新的范式，以ChatGPT为代表的生成式AI工具已在开发者中广泛采用。尽管ChatGPT的潜力已被广泛讨论，但关于开发者如何在真实实践中实际利用LLM辅助的经验证据仍然有限。为填补这一空白，我们对GitHub上的ChatGPT使用情况进行了大规模实证分析，并提出了DevChat——一个精选的数据集，其中包含2023年5月至2024年6月期间从GitHub收集的2,547个公开分享的ChatGPT对话链接。通过对DevChat的全面分析，我们探究了开发者与ChatGPT交互模式的特征，并识别出开发者在软件开发过程中分享此类对话的五类主要目的。此外，我们研究了ChatGPT最常参与的主要开发相关活动，并提出了一个将GitHub数据源、开发相关活动与SE任务关联起来的映射框架。研究发现：交互通常简短且以任务为中心（多数为1-3轮对话）；开发者分享对话主要为委派任务、解决问题和获取知识，可归纳为五类目的；ChatGPT最频繁地应用于软件实现以及维护与演化活动；我们识别出ChatGPT支持的39项细粒度SE任务，其中代码生成与补全以及代码修改与优化最为突出。本研究全面描绘了ChatGPT在真实软件开发场景中的应用图谱，为理解LLM在软件开发中的实际作用奠定了基础。

0

相关内容

软件（中国大陆及香港用语，台湾作软体，英文：Software）是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。

【新书】AI驱动的开发者：使用ChatGPT和Copilot构建出色的软件

【新书】AI驱动的开发者：使用ChatGPT和Copilot构建出色的软件

专知会员服务

48+阅读 · 2024年9月23日

如何构建媲美ChatGPT的开源大模型？南洋理工等最新《开源大型语言模型》综述，最佳开源LLM配方

如何构建媲美ChatGPT的开源大模型？南洋理工等最新《开源大型语言模型》综述，最佳开源LLM配方

专知会员服务

75+阅读 · 2023年11月29日

《通过案例研究展示ChatGPT的实用性和局限性》CMU 2023最新37页报告

《通过案例研究展示ChatGPT的实用性和局限性》CMU 2023最新37页报告

专知会员服务

57+阅读 · 2023年9月24日

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

专知会员服务

41+阅读 · 2023年9月17日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

ChatGPT懂常识吗？中科院等最新《ChatGPT是一个有知识但没有经验的求解器:大型语言模型常识问题的研究》论文，

ChatGPT懂常识吗？中科院等最新《ChatGPT是一个有知识但没有经验的求解器:大型语言模型常识问题的研究》论文，

专知会员服务

81+阅读 · 2023年4月5日

【ChatGPT系列报告】ChatGPT:大型语言模型对执法的影响,欧洲刑警组织创新实验室编著

【ChatGPT系列报告】ChatGPT:大型语言模型对执法的影响,欧洲刑警组织创新实验室编著

专知会员服务

35+阅读 · 2023年4月1日

ChatGPT如何垂直化？彭博发布《BloombergGPT-500亿参数的金融大型语言模型》论文，65页pdf详述模型优异性能（附中英文版论文下载）

ChatGPT如何垂直化？彭博发布《BloombergGPT-500亿参数的金融大型语言模型》论文，65页pdf详述模型优异性能（附中英文版论文下载）

专知会员服务

143+阅读 · 2023年3月31日

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

专知会员服务

188+阅读 · 2023年3月2日

ChatGPT如何work的？最新《大型语言模型》综述，51页slides

ChatGPT如何work的？最新《大型语言模型》综述，51页slides

专知会员服务

162+阅读 · 2023年2月28日

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

专知

27+阅读 · 2023年4月13日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

CSDN

16+阅读 · 2023年4月12日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

专知

27+阅读 · 2023年4月10日

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

专知

29+阅读 · 2023年4月9日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

新智元

29+阅读 · 2022年12月1日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

Security Analysis of ChatGPT: Threats and Privacy Risks

Arxiv

0+阅读 · 2月1日

Bridging Instead of Replacing Online Coding Communities with AI through Community-Enriched Chatbot Designs

Arxiv

0+阅读 · 1月28日

Usage, Effects and Requirements for AI Coding Assistants in the Enterprise: An Empirical Study

Arxiv

0+阅读 · 1月27日

AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development

Arxiv

0+阅读 · 1月27日

Bridging Instead of Replacing Online Coding Communities with AI through Community-Enriched Chatbot Designs

Arxiv

0+阅读 · 1月26日

Speed at the Cost of Quality: How Cursor AI Increases Short-Term Velocity and Long-Term Complexity in Open-Source Projects

Arxiv

0+阅读 · 1月26日

On Autopilot? An Empirical Study of Human-AI Teaming and Review Practices in Open Source

Arxiv

0+阅读 · 1月20日

AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development

Arxiv

0+阅读 · 1月20日

Revisiting Software Engineering Education in the Era of Large Language Models: A Curriculum Adaptation and Academic Integrity Framework

Arxiv

0+阅读 · 1月18日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

64+阅读 · 2023年3月29日

VIP会员

文章信息

相关主题

相关VIP内容

【新书】AI驱动的开发者：使用ChatGPT和Copilot构建出色的软件

【新书】AI驱动的开发者：使用ChatGPT和Copilot构建出色的软件

专知会员服务

48+阅读 · 2024年9月23日

如何构建媲美ChatGPT的开源大模型？南洋理工等最新《开源大型语言模型》综述，最佳开源LLM配方

如何构建媲美ChatGPT的开源大模型？南洋理工等最新《开源大型语言模型》综述，最佳开源LLM配方

专知会员服务

75+阅读 · 2023年11月29日

《通过案例研究展示ChatGPT的实用性和局限性》CMU 2023最新37页报告

《通过案例研究展示ChatGPT的实用性和局限性》CMU 2023最新37页报告

专知会员服务

57+阅读 · 2023年9月24日

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

专知会员服务

41+阅读 · 2023年9月17日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

ChatGPT懂常识吗？中科院等最新《ChatGPT是一个有知识但没有经验的求解器:大型语言模型常识问题的研究》论文，

ChatGPT懂常识吗？中科院等最新《ChatGPT是一个有知识但没有经验的求解器:大型语言模型常识问题的研究》论文，

专知会员服务

81+阅读 · 2023年4月5日

【ChatGPT系列报告】ChatGPT:大型语言模型对执法的影响,欧洲刑警组织创新实验室编著

【ChatGPT系列报告】ChatGPT:大型语言模型对执法的影响,欧洲刑警组织创新实验室编著

专知会员服务

35+阅读 · 2023年4月1日

ChatGPT如何垂直化？彭博发布《BloombergGPT-500亿参数的金融大型语言模型》论文，65页pdf详述模型优异性能（附中英文版论文下载）

ChatGPT如何垂直化？彭博发布《BloombergGPT-500亿参数的金融大型语言模型》论文，65页pdf详述模型优异性能（附中英文版论文下载）

专知会员服务

143+阅读 · 2023年3月31日

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

专知会员服务

188+阅读 · 2023年3月2日

ChatGPT如何work的？最新《大型语言模型》综述，51页slides

ChatGPT如何work的？最新《大型语言模型》综述，51页slides

专知会员服务

162+阅读 · 2023年2月28日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

专知

27+阅读 · 2023年4月13日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

CSDN

16+阅读 · 2023年4月12日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

专知

27+阅读 · 2023年4月10日

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用，31页pdf

专知

29+阅读 · 2023年4月9日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

新智元

29+阅读 · 2022年12月1日

相关论文

Security Analysis of ChatGPT: Threats and Privacy Risks

Arxiv

0+阅读 · 2月1日

Bridging Instead of Replacing Online Coding Communities with AI through Community-Enriched Chatbot Designs

Arxiv

0+阅读 · 1月28日

Usage, Effects and Requirements for AI Coding Assistants in the Enterprise: An Empirical Study

Arxiv

0+阅读 · 1月27日

AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development

Arxiv

0+阅读 · 1月27日

Bridging Instead of Replacing Online Coding Communities with AI through Community-Enriched Chatbot Designs

Arxiv

0+阅读 · 1月26日

Speed at the Cost of Quality: How Cursor AI Increases Short-Term Velocity and Long-Term Complexity in Open-Source Projects

Arxiv

0+阅读 · 1月26日

On Autopilot? An Empirical Study of Human-AI Teaming and Review Practices in Open Source

Arxiv

0+阅读 · 1月20日

AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development

Arxiv

0+阅读 · 1月20日

Revisiting Software Engineering Education in the Era of Large Language Models: A Curriculum Adaptation and Academic Integrity Framework

Arxiv

0+阅读 · 1月18日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

64+阅读 · 2023年3月29日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员