GitHub Template Repositories: Served Domains, Maintenance, and Practitioner Guidelines - 专知论文

会员服务 ·

0

指南 · GitHub · 设计 · 分析 · 代码 ·

GitHub Template Repositories: Served Domains, Maintenance, and Practitioner Guidelines

翻译：GitHub模板仓库：服务领域、维护情况与从业者指南

Leuson Da Silva,Altaf Allah Abbassi,Imen Trabelsi,Paulo Borba,Foutse Khomh

from arxiv, 12 pages, 3 figures

Over time, GitHub has introduced different strategies for sharing reusable code artifacts. In addition to fork-based reuse, template repositories provide a distinct feature for generating new projects from scaffolding. Although this feature has been available since 2019, little is known about the domains it supports, its maintenance characteristics, or the practices that guide practitioners for effective template design. To address this gap, we conduct a large-scale empirical study of GitHub template repositories across the five most used programming languages. First, we mine and categorize templates to analyze the domains they serve, exploring the LLM-as-a-judge strategy. Next, we explore the reliability of templates by evaluating the associations between repository characteristics and activity, and quality-related issues (e.g., code smells, vulnerabilities, and security hotspots) through statistical analysis. Finally, we qualitatively analyze a representative subset of templates to derive practical guidelines and recurring pitfalls for template design and management. Our results show that Web Development is the predominant domain across ecosystems, while maintenance and quality issues vary by programming language. We further find that high-quality templates tend to adopt established software engineering practices, while providing comprehensive documentation and clear guidance for use. Overall, our findings offer empirical insights and actionable guidance to support practitioners in designing and adopting high-quality template repositories.

翻译：随着时间推移，GitHub引入了不同策略来共享可复用的代码工件。除了基于复刻（fork）的复用方式外，模板仓库（template repository）提供了一种从脚手架生成新项目的独特功能。尽管该功能自2019年便已可用，但学界对其所服务的领域、维护特性以及指导从业者进行有效模板设计的实践方法知之甚少。为弥补这一研究空白，我们对五种最常用编程语言的GitHub模板仓库进行了大规模实证研究。首先，我们挖掘并分类模板，以分析其服务的领域，并探索了"大语言模型作为评判者"策略。接着，通过统计分析评估仓库特征与活跃度、与质量相关问题（如代码坏味、漏洞及安全热点）之间的关联，进而探究模板的可靠性。最后，我们对具有代表性的模板子集进行定性分析，以提取模板设计与管理方面的实用指南及常见陷阱。研究结果表明，Web开发是各生态系统中的主导领域，而维护与质量问题则因编程语言而异。我们进一步发现，高质量模板倾向于采用成熟的软件工程实践，并提供全面的文档与清晰的使用指南。总体而言，我们的研究结果为从业者设计并采用高质量模板仓库提供了实证洞见与可操作指导。

0

相关内容

【新书】GitHub操作实战，257页pdf

【新书】GitHub操作实战，257页pdf

专知会员服务

55+阅读 · 2024年10月25日

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

专知会员服务

46+阅读 · 2024年9月17日

【硬核书】Git版本控制，用于协作软件开发的强大工具和技术，第三版，745页pdf

【硬核书】Git版本控制，用于协作软件开发的强大工具和技术，第三版，745页pdf

专知会员服务

45+阅读 · 2022年11月1日

【机器学习工具箱(机器学习实用库分类大列表)】《Machine Learning Toolbox》by Amit Chaudhary

【机器学习工具箱(机器学习实用库分类大列表)】《Machine Learning Toolbox》by Amit Chaudhary

专知会员服务

31+阅读 · 2020年7月12日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

专知会员服务

65+阅读 · 2020年1月6日

【书籍推荐】Git与Github学习使用指南（Beginning Git and GitHub），附294页pdf

【书籍推荐】Git与Github学习使用指南（Beginning Git and GitHub），附294页pdf

专知会员服务

97+阅读 · 2020年1月4日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源，附787页pdf

【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源，附787页pdf

专知会员服务

212+阅读 · 2019年12月15日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

八个不容错过的 GitHub Copilot 功能！

八个不容错过的 GitHub Copilot 功能！

CSDN

11+阅读 · 2022年9月22日

Github：NLP相关代码、书目、论文、博文、算法、项目资源（附链接）

Github：NLP相关代码、书目、论文、博文、算法、项目资源（附链接）

数据派THU

35+阅读 · 2019年7月17日

这个项目火了！各种深度学习架构，模型和技巧的集合

这个项目火了！各种深度学习架构，模型和技巧的集合

大数据技术

14+阅读 · 2019年6月13日

GitHub趋势榜第一：TensorFlow+PyTorch深度学习资源大汇总

GitHub趋势榜第一：TensorFlow+PyTorch深度学习资源大汇总

新智元

19+阅读 · 2019年6月8日

GitHub万星的中文机器学习资源：路线图、视频、电子书、学习建议全在这

GitHub万星的中文机器学习资源：路线图、视频、电子书、学习建议全在这

数据派THU

48+阅读 · 2019年4月28日

Github项目推荐 | PyTorch 中文手册（pytorch handbook）

Github项目推荐 | PyTorch 中文手册（pytorch handbook）

AI研习社

51+阅读 · 2019年2月18日

超级盘点 | Github年终各大排行榜（内附开源项目学习资源）

超级盘点 | Github年终各大排行榜（内附开源项目学习资源）

七月在线实验室

19+阅读 · 2018年12月19日

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

专知

13+阅读 · 2018年11月30日

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

GAN生成式对抗网络

10+阅读 · 2018年10月21日

Github 项目推荐 | 不容错过的迁移学习领域自适应资源

Github 项目推荐 | 不容错过的迁移学习领域自适应资源

AI研习社

29+阅读 · 2018年4月29日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

高性能视频云转码服务的优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

支持可扩展事务处理的数据库日志机制及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

多租户数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于草图语义部件的三维模型检索技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Reconstructing Template-Memorized Images from Natural Prompts

Arxiv

0+阅读 · 6月11日

SentTrack: Sentiment-Driven Bottleneck Detection in GitHub Issue Repositories

Arxiv

0+阅读 · 6月9日

RepoLaunch: Automating Build and Management of Code Repositories across Languages and Platforms

Arxiv

0+阅读 · 6月6日

Agentic Very Much! Adoption of Coding Agent in New GitHub Projects

Arxiv

0+阅读 · 6月5日

From Custom Logic to APIs: Understanding and Recommending API Replacement Refactorings

Arxiv

0+阅读 · 6月5日

Architecturally Significant MLOps Guidelines for ML Model Integration and Deployment: a Gray Literature Review

Arxiv

0+阅读 · 6月3日

SetupX: Can LLM Agents Learn from Past Failures in Functionality-Correct Code Repository Setup?

Arxiv

0+阅读 · 5月27日

On the GitHub Actions Language: Usage, Evolution, and Workflow Reliability

Arxiv

0+阅读 · 5月26日

Album: executable building blocks for scientific imaging routines, from sharing to LLM-assisted orchestration

Arxiv

0+阅读 · 4月21日

From Static Repositories to Agentic Knowledge Webs: ResearchTwin and the S-Index for Federated Human-AI Research Discovery

Arxiv

0+阅读 · 2月13日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

【新书】GitHub操作实战，257页pdf

【新书】GitHub操作实战，257页pdf

专知会员服务

55+阅读 · 2024年10月25日

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

专知会员服务

46+阅读 · 2024年9月17日

【硬核书】Git版本控制，用于协作软件开发的强大工具和技术，第三版，745页pdf

【硬核书】Git版本控制，用于协作软件开发的强大工具和技术，第三版，745页pdf

专知会员服务

45+阅读 · 2022年11月1日

【机器学习工具箱(机器学习实用库分类大列表)】《Machine Learning Toolbox》by Amit Chaudhary

【机器学习工具箱(机器学习实用库分类大列表)】《Machine Learning Toolbox》by Amit Chaudhary

专知会员服务

31+阅读 · 2020年7月12日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

FB大牛撰文推介，PySlowFast！Facebook开源视频理解前沿算法代码库，视频SOTA技术全在这了！

专知会员服务

65+阅读 · 2020年1月6日

【书籍推荐】Git与Github学习使用指南（Beginning Git and GitHub），附294页pdf

【书籍推荐】Git与Github学习使用指南（Beginning Git and GitHub），附294页pdf

专知会员服务

97+阅读 · 2020年1月4日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源，附787页pdf

【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源，附787页pdf

专知会员服务

212+阅读 · 2019年12月15日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

八个不容错过的 GitHub Copilot 功能！

八个不容错过的 GitHub Copilot 功能！

CSDN

11+阅读 · 2022年9月22日

Github：NLP相关代码、书目、论文、博文、算法、项目资源（附链接）

Github：NLP相关代码、书目、论文、博文、算法、项目资源（附链接）

数据派THU

35+阅读 · 2019年7月17日

这个项目火了！各种深度学习架构，模型和技巧的集合

这个项目火了！各种深度学习架构，模型和技巧的集合

大数据技术

14+阅读 · 2019年6月13日

GitHub趋势榜第一：TensorFlow+PyTorch深度学习资源大汇总

GitHub趋势榜第一：TensorFlow+PyTorch深度学习资源大汇总

新智元

19+阅读 · 2019年6月8日

GitHub万星的中文机器学习资源：路线图、视频、电子书、学习建议全在这

GitHub万星的中文机器学习资源：路线图、视频、电子书、学习建议全在这

数据派THU

48+阅读 · 2019年4月28日

Github项目推荐 | PyTorch 中文手册（pytorch handbook）

Github项目推荐 | PyTorch 中文手册（pytorch handbook）

AI研习社

51+阅读 · 2019年2月18日

超级盘点 | Github年终各大排行榜（内附开源项目学习资源）

超级盘点 | Github年终各大排行榜（内附开源项目学习资源）

七月在线实验室

19+阅读 · 2018年12月19日

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

专知

13+阅读 · 2018年11月30日

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

GAN生成式对抗网络

10+阅读 · 2018年10月21日

Github 项目推荐 | 不容错过的迁移学习领域自适应资源

Github 项目推荐 | 不容错过的迁移学习领域自适应资源

AI研习社

29+阅读 · 2018年4月29日

相关论文

Reconstructing Template-Memorized Images from Natural Prompts

Arxiv

0+阅读 · 6月11日

SentTrack: Sentiment-Driven Bottleneck Detection in GitHub Issue Repositories

Arxiv

0+阅读 · 6月9日

RepoLaunch: Automating Build and Management of Code Repositories across Languages and Platforms

Arxiv

0+阅读 · 6月6日

Agentic Very Much! Adoption of Coding Agent in New GitHub Projects

Arxiv

0+阅读 · 6月5日

From Custom Logic to APIs: Understanding and Recommending API Replacement Refactorings

Arxiv

0+阅读 · 6月5日

Architecturally Significant MLOps Guidelines for ML Model Integration and Deployment: a Gray Literature Review

Arxiv

0+阅读 · 6月3日

SetupX: Can LLM Agents Learn from Past Failures in Functionality-Correct Code Repository Setup?

Arxiv

0+阅读 · 5月27日

On the GitHub Actions Language: Usage, Evolution, and Workflow Reliability

Arxiv

0+阅读 · 5月26日

Album: executable building blocks for scientific imaging routines, from sharing to LLM-assisted orchestration

Arxiv

0+阅读 · 4月21日

From Static Repositories to Agentic Knowledge Webs: ResearchTwin and the S-Index for Federated Human-AI Research Discovery

Arxiv

0+阅读 · 2月13日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

高性能视频云转码服务的优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

支持可扩展事务处理的数据库日志机制及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

多租户数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于草图语义部件的三维模型检索技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员